Text copied to clipboard!

Název

Text copied to clipboard!

Spark Vývojář

Popis

Text copied to clipboard!
Hledáme vývojáře Spark, který se připojí k našemu týmu a bude se podílet na vývoji a optimalizaci distribuovaných datových aplikací. Tento kandidát bude zodpovědný za návrh, implementaci a údržbu řešení založených na Apache Spark, která zpracovávají velké objemy dat v reálném čase i dávkově. Ideální kandidát má zkušenosti s velkými datovými platformami, rozumí principům paralelního zpracování a má silné programátorské dovednosti v jazycích jako Scala, Java nebo Python. Na této pozici budete úzce spolupracovat s datovými inženýry, datovými analytiky a dalšími vývojáři na návrhu efektivních datových toků a integraci s dalšími systémy. Budete se podílet na vývoji ETL procesů, optimalizaci výkonu Spark úloh a zajištění škálovatelnosti a spolehlivosti datových řešení. Dále budete zodpovědní za psaní čistého, udržovatelného kódu a dodržování osvědčených postupů v oblasti vývoje softwaru. Tato role vyžaduje schopnost samostatné práce i týmové spolupráce, analytické myšlení a ochotu učit se nové technologie. Pokud máte vášeň pro práci s daty, zkušenosti s Apache Spark a hledáte příležitost pracovat na inovativních projektech, rádi vás přivítáme v našem týmu.

Odpovědnosti

Text copied to clipboard!
  • Vývoj a údržba aplikací založených na Apache Spark
  • Návrh a implementace ETL procesů pro zpracování velkých dat
  • Optimalizace výkonu Spark úloh a ladění problémů
  • Spolupráce s datovými inženýry a analytiky
  • Integrace Spark řešení s dalšími systémy a platformami
  • Zajištění kvality kódu a dodržování vývojových standardů
  • Účast na návrhu architektury datových řešení
  • Monitorování a správa běžících Spark úloh
  • Dokumentace technických řešení a procesů
  • Průběžné sledování novinek v oblasti big data technologií

Požadavky

Text copied to clipboard!
  • Zkušenosti s Apache Spark (minimálně 2 roky)
  • Znalost programovacích jazyků Scala, Java nebo Python
  • Zkušenosti s distribuovaným zpracováním dat
  • Znalost nástrojů jako Hadoop, Hive, Kafka výhodou
  • Zkušenosti s databázemi (SQL i NoSQL)
  • Schopnost psát čistý a udržovatelný kód
  • Znalost principů ETL a datového modelování
  • Zkušenosti s cloudovými platformami (např. AWS, Azure, GCP) výhodou
  • Schopnost týmové spolupráce i samostatné práce
  • Dobré analytické a komunikační schopnosti

Potenciální otázky na pohovor

Text copied to clipboard!
  • Jaké máte zkušenosti s Apache Spark?
  • V jakém jazyce nejčastěji vyvíjíte Spark aplikace?
  • Jak optimalizujete výkon Spark úloh?
  • Máte zkušenosti s cloudovými platformami?
  • Jaké nástroje používáte pro monitorování Spark úloh?
  • Jak řešíte problémy s výkonem při zpracování velkých dat?
  • Jaké ETL nástroje jste používal(a)?
  • Máte zkušenosti s integrací Spark s Kafka nebo Hive?
  • Jaké jsou vaše zkušenosti s databázemi?
  • Jak přistupujete k psaní udržovatelného kódu?